智能论文笔记

STTAR: Surgical Tool Tracking using off-the-shelf Augmented Reality Head-Mounted Displays

Alejandro Martin-Gomez , Haowei Li , Tianyu Song , Sheng Yang , Guangzhi Wang , Hui Ding , Nassir Navab , Zhe Zhao , Mehran Armand

分类：机器人

2022-08-17

使用增强现实（AR）用于导航目的，这表明在手术手术过程中协助医生有益。这些应用通常需要知道外科手术工具和患者的姿势，以提供外科医生在任务执行过程中可以使用的视觉信息。现有的医学级跟踪系统使用放置在手术室内的红外摄像头（OR）来识别感兴趣的对象附加并计算其姿势的复古反射标记。一些市售的AR头式显示器（HMD）使用类似的摄像头进行自定位，手动跟踪和估算对象的深度。这项工作提出了一个使用AR HMD的内置摄像机来准确跟踪复古反射标记的框架，例如在手术过程中使用的标记，而无需集成任何其他组件。该框架还能够同时跟踪多个工具。我们的结果表明，横向翻译的准确度为0.09 +-0.06毫米，可以实现标记的跟踪和检测，纵向翻译的0.42 +-0.32 mm，绕垂直轴旋转的0.80 +-0.39 ver。此外，为了展示所提出的框架的相关性，我们在手术程序的背景下评估了系统的性能。该用例旨在在骨科过程中复制K-Wire插入的场景。为了进行评估，为两名外科医生和一名生物医学研究人员提供了视觉导航，每次都进行了21次注射。该用例的结果提供了与基于AR的导航程序报告的相当精度。

translated by 谷歌翻译

SyntheX: Scaling Up Learning-based X-ray Image Analysis Through In Silico Experiments

Cong Gao , Benjamin D. Killeen , Yicheng Hu , Robert B. Grupp , Russell H. Taylor , Mehran Armand , Mathias Unberath

分类：计算机视觉 | 机器学习

2022-06-13

现在，人工智能（AI）可以自动解释医学图像以供临床使用。但是，AI在介入图像中的潜在用途（相对于参与分类或诊断的图像），例如在手术期间的指导，在很大程度上尚未开发。这是因为目前，使用现场分析对现场手术收集的数据进行了事后分析，这是因为手术AI系统具有基本和实际限制，包括道德考虑，费用，可扩展性，数据完整性以及缺乏地面真相。在这里，我们证明从人类模型中创建逼真的模拟图像是可行的替代方法，并与大规模的原位数据收集进行了补充。我们表明，对现实合成数据的训练AI图像分析模型，结合当代域的概括或适应技术，导致在实际数据上的模型与在精确匹配的真实数据训练集中训练的模型相当地执行的模型。由于从基于人类的模型尺度的合成生成培训数据，因此我们发现我们称为X射线图像分析的模型传输范式（我们称为Syntheex）甚至可以超越实际数据训练的模型，因为训练的有效性较大的数据集。我们证明了合成在三个临床任务上的潜力：髋关节图像分析，手术机器人工具检测和COVID-19肺病变分割。 Synthex提供了一个机会，可以极大地加速基于X射线药物的智能系统的概念，设计和评估。此外，模拟图像环境还提供了测试新颖仪器，设计互补手术方法的机会，并设想了改善结果，节省时间或减轻人为错误的新技术，从实时人类数据收集的道德和实际考虑方面摆脱了人为错误。

translated by 谷歌翻译

A Non-linear MPC Local Planner for Tractor-Trailer Vehicles in Forward and Backward Maneuvering

Behnam Moradi , Mehran Mehrandezh

分类：机器人

2022-12-22

Designing a local planner to control tractor-trailer vehicles in forward and backward maneuvering is a challenging control problem in the research community of autonomous driving systems. Considering a critical situation in the stability of tractor-trailer systems, a practical and novel approach is presented to design a non-linear MPC(NMPC) local planner for tractor-trailer autonomous vehicles in both forward and backward maneuvering. The tractor velocity and steering angle are considered to be control variables. The proposed NMPC local planner is designed to handle jackknife situations, avoiding multiple static obstacles, and path following in both forward and backward maneuvering. The challenges mentioned above are converted into a constrained problem that can be handled simultaneously by the proposed NMPC local planner. The direct multiple shooting approach is used to convert the optimal control problem(OCP) into a non-linear programming problem(NLP) that IPOPT solvers can solve in CasADi. The controller performance is evaluated through different backup and forward maneuvering scenarios in the Gazebo simulation environment in real-time. It achieves asymptotic stability in avoiding static obstacles and accurate tracking performance while respecting path constraints. Finally, the proposed NMPC local planner is integrated with an open-source autonomous driving software stack called AutowareAi.

translated by 谷歌翻译

Domain Adaptation and Generalization on Functional Medical Images: A Systematic Survey

Gita Sarafraz , Armin Behnamnia , Mehran Hosseinzadeh , Ali Balapour , Amin Meghrazi , Hamid R. Rabiee

分类：计算机视觉 | 机器学习

2022-12-04

Machine learning algorithms have revolutionized different fields, including natural language processing, computer vision, signal processing, and medical data processing. Despite the excellent capabilities of machine learning algorithms in various tasks and areas, the performance of these models mainly deteriorates when there is a shift in the test and training data distributions. This gap occurs due to the violation of the fundamental assumption that the training and test data are independent and identically distributed (i.i.d). In real-world scenarios where collecting data from all possible domains for training is costly and even impossible, the i.i.d assumption can hardly be satisfied. The problem is even more severe in the case of medical images and signals because it requires either expensive equipment or a meticulous experimentation setup to collect data, even for a single domain. Additionally, the decrease in performance may have severe consequences in the analysis of medical records. As a result of such problems, the ability to generalize and adapt under distribution shifts (domain generalization (DG) and domain adaptation (DA)) is essential for the analysis of medical data. This paper provides the first systematic review of DG and DA on functional brain signals to fill the gap of the absence of a comprehensive study in this era. We provide detailed explanations and categorizations of datasets, approaches, and architectures used in DG and DA on functional brain images. We further address the attention-worthy future tracks in this field.

translated by 谷歌翻译

Experimental validation of machine-learning based spectral-spatial power evolution shaping using Raman amplifiers

Mehran Soltani , Francesco Da Ros , Andrea Carena , Darko Zibar

分类：机器学习

2022-09-26

我们通过实验验证一个实时机器学习框架，能够控制拉曼放大器的泵功率值以在二维（2D）中塑造信号功率演变：频率和光纤距离。在我们的设置中，优化了四个一阶反向传输泵的功率值，以实现所需的2D功率配置文件。泵功率优化框架包括一个卷积神经网络（CNN），然后是差分进化（DE）技术，在线应用于放大器设置，以自动实现目标2D功率配置文件。可实现的2D配置文件的结果表明，该框架能够确保获得的最大绝对误差（MAE）（<0.5 dB）与获得的目标2D配置文件之间。此外，该框架在多目标设计方案中进行了测试，该方案的目标是在跨度结束时达到固定增益水平的2D配置文件，共同在整个光纤长度上进行最小的光谱游览。在这种情况下，实验结果断言，对于目标扁平增益水平的2D轮廓，当设置在泵功率值中不受物理限制时，DE获得的最大增益偏差小于1 dB。模拟结果还证明，有足够的泵功率可用，可以实现更高的目标增益水平的更好的增益偏差（小于0.6 dB）。

translated by 谷歌翻译

MPC with Sensor-Based Online Cost Adaptation

Avadesh Meduri , Huaijiang Zhu , Armand Jordana , Ludovic Righetti

分类：机器人

2022-09-20

模型预测控制是为机器人生成复杂动作的强大工具。但是，它通常需要在线解决非凸问题以产生丰富的行为，这在计算上很昂贵，并且并非总是实时实用的。此外，通过当前状态空间方法，反馈回路中高维传感器数据（例如RGB-D图像）的直接集成具有挑战性。本文旨在解决这两个问题。它引入了模型预测控制方案，其中神经网络不断根据感官输入来更新二次程序的成本函数，旨在最大程度地减少一般的非凸任务丢失而不解决非convex问题在线。通过更新成本，机器人可以直接从传感器测量中适应环境的变化，而无需进行新的成本设计。此外，由于可以通过硬限制有效地解决二次程序，因此可以确保机器人安全部署。在工业机器人操纵器上进行了各种涉及任务的实验表明，我们的方法可以有效地解决具有高维视觉感觉输入的复杂的非凸问题，同时仍然对外部干扰保持稳定。

translated by 谷歌翻译

Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning

Mehran Raisi , Amirhossein Noohian , Luc Mccutcheon , Saber Fallah

分类：机器学习 | 机器人

2022-09-16

本文为基于MPC的基于MPC模型的增强学习方法的计划模块提出了一个新的评分功能，以解决使用奖励功能得分轨迹的固有偏见。所提出的方法使用折现价值和折扣价值提高了现有基于MPC的MBRL方法的学习效率。该方法利用最佳轨迹来指导策略学习，并根据现实世界更新其状态行动价值函数，并增强板载数据。在选定的Mujoco健身环境中评估了所提出方法的学习效率，以及在学习的模拟机器人模型中学习运动技能。结果表明，所提出的方法在学习效率和平均奖励回报方面优于当前的最新算法。

translated by 谷歌翻译

Few-shot Learning with Retrieval Augmented Language Model

Gautier Izacard , Patrick Lewis , Maria Lomeli , Lucas Hosseini , Fabio Petroni , Timo Schick , Jane Yu , Armand Joulin , Sebastian Riedel , Edouard Grave

分类：自然语言处理

2022-08-05

大型语言模型在各种任务上显示出令人印象深刻的几次结果。但是，当知识是此类结果的关键时，就像问题回答和事实检查之类的任务一样，似乎需要存储知识的大量参数计数。众所周知，检索增强模型可以在不需要多个参数的情况下在知识密集的任务上表现出色，但是目前尚不清楚它们是否在几个弹药设置中工作。在这项工作中，我们介绍了地图集，这是一个经过精心设计和预先训练的增强语言模型，能够通过很少的培训示例学习知识密集型任务。我们对包括MMLU，苏格兰短裙和归类等各种任务进行评估，并研究文档索引内容的影响，表明它可以很容易地进行更新。值得注意的是，在自然问题上仅使用64个示例在自然问题上达到超过42 \％的准确性，尽管参数少了50倍，但比540B参数模型的表现优于540b参数模型。

translated by 谷歌翻译

RGB-D Robotic Pose Estimation For a Servicing Robotic Arm

Jared Herron , Daniel Lopez , Jarred Jordan , Jillian Rudy , Aryslan Malik , Daniel Posada , Mehran Andalibi , Troy Henderson

分类：机器人

2022-07-23

预测，预测了大量的机器人和人为辅助任务。 NASA为了解这些天体的地质和构成的努力在很大程度上取决于机器人臂的使用。当人类与机器人探险家一起工作时，安全性和冗余方面至关重要。此外，机器人臂对于卫星维修和计划的轨道碎片缓解任务至关重要。这项工作的目的是创建一个基于自定义的计算机视觉（CV）的人工神经网络（ANN），该神经网络将能够快速识别从单个（RGB-D）的7度自由（DOF）机器人组的姿势图像 - 就像人类可以轻松识别手臂是否指向一定方向一样。 Sawyer机器人臂用于开发和培训这种智能算法。由于Sawyer的关节空间涵盖了7个维度，因此覆盖整个联合配置空间是一项无法克服的任务。在这项工作中，使用类似于Taguchi方法的正交阵列，以有效地跨越关节空间，以最少的训练图像数量。该生成的数据库用于训练自定义ANN，其准确度平均等于数据库生成使用的最小关节位移步骤的两倍。预先训练的ANN将有助于估计在太空站，航天器和流浪者作为辅助工具或应急计划上使用的机器人操纵器的姿势。

translated by 谷歌翻译

Single MR Image Super-Resolution using Generative Adversarial Network

Shawkh Ibne Rashid , Elham Shakibapour , Mehran Ebrahimi

分类：计算机视觉 | 机器学习

2022-07-16

可以使用超分辨率方法改善医学图像的空间分辨率。实际增强的超级分辨率生成对抗网络（Real-Esrgan）是最近用于产生较高分辨率图像的最新有效方法之一，给定较低分辨率的输入图像。在本文中，我们应用这种方法来增强2D MR图像的空间分辨率。在我们提出的方法中，我们稍微修改了从脑肿瘤分割挑战（BRATS）2018数据集中训练2D磁共振图像（MRI）的结构。通过计算SSIM（结构相似性指数量度），NRMSE（归一化根平方误），MAE（平均绝对误差）和VIF（视觉信息保真度）值，通过计算SSIM（结构相似性指数量度）进行定性和定量验证。

translated by 谷歌翻译